Cos'è funzione di verosimiglianza?

Funzione di Verosimiglianza (Likelihood Function)

La funzione di verosimiglianza, o likelihood function in inglese, è uno strumento fondamentale in statistica, in particolare nell'inferenza statistica e nell'ambito della stima dei parametri. Essa fornisce una misura di quanto sia plausibile un dato insieme di parametri di un modello statistico, dato un insieme di dati osservati. In altre parole, la funzione di verosimiglianza quantifica la compatibilità tra i dati osservati e un modello statistico con specifici valori dei suoi parametri.

Definizione:

Formalmente, sia X un insieme di dati osservati e θ un vettore di parametri che definiscono un modello statistico. La funzione di verosimiglianza è definita come:

L(θ | X) = P(X | θ)

Dove:

  • L(θ | X) rappresenta la verosimiglianza dei parametri θ dato l'insieme di dati X.
  • P(X | θ) rappresenta la probabilità di osservare i dati X assumendo che i parametri del modello siano θ. Questa è la stessa formula usata per calcolare la probabilità condizionata, ma interpretata in modo diverso. Nella verosimiglianza, X è fisso (i dati sono stati osservati) e θ varia.

Interpretazione:

È cruciale distinguere la verosimiglianza dalla probabilità a posteriori (posterior probability). Mentre la verosimiglianza valuta la plausibilità dei parametri dato i dati, la probabilità a posteriori valuta la plausibilità dei parametri data la combinazione dei dati e di una conoscenza pregressa sui parametri (prior).

Usi Principali:

  • Stima di Massima Verosimiglianza (MLE): Il valore di θ che massimizza la funzione di verosimiglianza viene chiamato stima di massima verosimiglianza (Maximum Likelihood Estimate, MLE). Questo valore è considerato la "migliore" stima dei parametri del modello, in quanto rende i dati osservati i più probabili. Puoi trovare maggiori informazioni sulla stima%20di%20massima%20verosimiglianza.
  • Test di Ipotesi: La funzione di verosimiglianza può essere utilizzata per confrontare la plausibilità di diverse ipotesi statistiche, ad esempio tramite il likelihood%20ratio%20test.
  • Intervalli di Confidenza: È possibile costruire intervalli di confidenza basati sulla funzione di verosimiglianza.

Calcolo della Verosimiglianza:

Il calcolo della verosimiglianza dipende dal tipo di modello statistico e dalla distribuzione dei dati. Spesso, per semplificare i calcoli, si utilizza la log-verosimiglianza, che è il logaritmo naturale della verosimiglianza. La massimizzazione della log-verosimiglianza è equivalente alla massimizzazione della verosimiglianza originale, ma spesso i calcoli risultano più semplici.

Esempio Semplice (Distribuzione Bernoulli):

Supponiamo di avere un campione di n prove di Bernoulli, dove ogni prova ha esito successo con probabilità p. Osserviamo k successi. La funzione di verosimiglianza per p è:

L(p | k, n) = p<sup>k</sup> * (1 - p)<sup>(n - k)</sup>

Per trovare la MLE di p, si massimizza questa funzione (o la sua log-verosimiglianza) rispetto a p. La soluzione è p_MLE = k/n, ovvero la proporzione di successi nel campione.

Considerazioni Importanti:

  • Identificabilità: È importante assicurarsi che il modello sia identificabile, ovvero che diversi insiemi di parametri non producano la stessa distribuzione dei dati. Se il modello non è identificabile, la funzione di verosimiglianza potrebbe avere più massimi, rendendo difficile l'interpretazione dei risultati.
  • Dipendenza dal Modello: La funzione di verosimiglianza dipende fortemente dal modello statistico scelto. Una scelta errata del modello può portare a stime di parametri inaccurate.
  • Campioni Grandi: In generale, con campioni di dati sufficientemente grandi, la MLE gode di buone proprietà asintotiche, come la consistenza (convergenza al valore vero del parametro) e la normalità asintotica.

In sintesi, la funzione di verosimiglianza è uno strumento potente per l'inferenza statistica, in particolare per la stima dei parametri e il test di ipotesi. La sua corretta applicazione richiede una comprensione approfondita del modello statistico e delle sue proprietà. Un argomento correlato è inferenza%20bayesiana, che utilizza la verosimiglianza in combinazione con una prior per calcolare la probabilità a posteriori.